對於特徵工程來說,Feature Crosses(特徵交叉)在日漸複雜的模型當中顯得越來越重要。
顧名思義,我們先來猜猜Feature Crosses到底在做什麼。
Feature就是某種形式的特徵,以描述一個人來說,可能是有無戴眼鏡、長短頭髮或是性別。
凡是可以用來描述我們想說明事物的組合單元,都可以稱為特徵。
Crosses就有趣了,他可以代表所謂的交叉符(X)。
但我想在科學上更接近的是彼此交錯的關係,就像Crossover之於基因體學。
既然是指彼此,就代表Crosses影響的項目是由基本的複數量所衍生的高維度量。
比如在平面上,x軸與y軸可說是彼此正交的基底,而(xy)這種相乘的結果就會是一種Crosses的結果。
恩,好的,例子這就來了
如果想把圖形中的藍色點與黃色點分開,想單純用一條線(線性系統)分開並不會得到良好的結果。
反之,如果我們產生出一種新的量為兩軸相乘,就能很好地以 > 0
或 < 0
分開。
這種交互關係而產生新變量的方法,就稱為Feature Crosses。
這種問題就是discriminator要做的事情,或者我們也可以稱為一種分類問題
別擔心,可以仔細觀察,Feature Crosses幫助我們的地方,不正是找出非線性項目嗎?
如果可以用線性組合完成這個問題,那就老老實實觀察線性的可能。
如果發現(在白紙上)怎麼畫都無法給出一個合理的切割面,代表這時候非線性組合就可以派上用場。
而透過計算能力的進步,主流的非線性關係主要改由神經網路結構來協助我們得到良好的結果。